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摘要 : 受 车 型 复杂 、 雷 诺 数 高 等 因素 影响 ， 汽 车 外 流 场 流动 的 数值 计算 规模 巨 
大 且 难 以 精确 求解 。 发 展 高 效 并 行 算法 以 利用 超级 计算 平台 资源 成 为 该 领域 的 
研究 热点 。 本文 提 出 一 种 全 隐 格 式 的 可 扩展 并 行 Newton-Krylov-Schwarz 算法 
对 某 真实 汽车 的 外 流 场 流动 问题 进行 计算 ， 并 与 商业 软件 计算 结果 进行 对 比 。 
数值 结果 显示 ， 本 文 的 算法 在 超过 2000 个 处 理 器 规模 下 仍 具 有 很 好 的 并 行 可 
扩展 性 。 
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中 图 分 类 号 : 


t 


IT 


A scalable numerical method for simulating the external flows around car 


The high-fidelity numerical simulation of unsteady flows around car is a very 
challenging computational problem because of the huge computation caused by 
high Reynolds number and complex geometry. In this paper, we present a scalable 
parallel Newton-Krylov-Schwarz based fully implicit algorithm for the full 
unsteady incompressible flows around car. and we also compare our results with 
results obtained from commercial CFD software. Our algorithm shows very good 


parallel scalability on a supercomputer with over two thousand processors. 


1 引言 


在 汽车 工业 中 , 车 体外 型 的 空气 动力 学 分 析 涉 及 车 辆 设计 、 测 试 和 制造 
等 诸多 环节 ， 直接 决定 了 车 辆 的 能 耗 比 、 安 全 性 乃至 美观 性 ， 同 时 也 对 乘客 
的 舒适 感 以 及 道路 周边 噪声 环境 产生 重要 影响 ,获取 车 体外 流 场 流体 流动 数 


据 是 进行 车 型 气动 分 析 的 前 提 , 工程 师 只 有 在 速度 、 压 力 等 物理 参量 的 基础 
上 才能 通过 一 系列 分 析 手 段 得 到 车 型 的 阻力 系数 、 气 动力 矩 等 评价 车 型 的 直 
观 数 据 ， 因 此 外 流 场 流动 问题 对 汽车 空气 动力 学 研究 意义 重大 。 

最 初 ， 风 洞 实 验 是 获取 外 流 场 数 据 的 主要 技术 手段 , 通过 全 尺寸 或 比例 
模型 在 风 洞 中 的 测试 结果 来 调整 实际 车 型 的 几何 尺寸 与 构 形 ,根据 Buchheim 
的 经 验 ,， 开 发 一 款 新 的 车 型 需要 1000 小 时 的 风 洞 实验 ”， 显 然 这 种 方法 需要 
非常 长 的 设计 周期 ,严重 影响 车 型 定型 与 市 场 推广 。 近 二 十 年 来 ， 利 用 计算 
机 来 求解 流体 流动 的 控制 偏 微分 方程 组 , 并 通过 得 到 的 流 场 来 研究 流动 现象 
的 计算 流体 力学 (Computational Fluid Dynamics，CFD) 技术 广泛 应 用 于 
在 汽车 设计 领域 ,掀起 了 数字 化 设计 的 浪潮 , 现 已 成 为 不 可 或 缺 的 技术 手段 ， 
其 应 用 程度 已 经 成 为 评价 工程 设计 先进 水 平 的 主要 标志 ”与 风 洞 实验 相 比 ， 
CFD 技 术 虽 有 助 于 工程 师 达 到 数字 化 ， 灵 活性 与 低 成 本 的 理想 设计 模式 ， 但 
复杂 的 几何 构造 、 多 变 的 运行 环境 等 因素 带 来 的 庞大 计算 量 使 得 汽车 外 流 场 
精确 模拟 极其 困难 , 使 得 计算 能 力 成 为 汽车 工程 计算 面 对 的 最 直接 也 最 重要 
问题 。 总 体 而 言 , 目前 影响 计算 流体 力学 技术 应 用 的 两 个 关键 因素 有 如 下 两 
HT 


1. 流动 模型 的 选取 
在 流体 力学 中 ， 雷 诺 数 Re 作为 一 个 无 量 纲 量 用 来 表征 流体 运动 中 惯性 
力 与 粘性 力 之 比 ，Re 越 大 表明 流体 运动 中 对 流 越 占 优 ， 体 现 到 具体 的 计算 
过 程 中 便 是 控制 方程 离散 后 得 到 的 方程 组 非 线 性 越 强 , 对 求解 造成 巨大 困难 。 
而 汽车 外 流 场 流动 为 典型 的 高 雷诺 数 流动 ， 一般 大 于 10;， 采用 未 添加 任何 
近似 流动 模型 的 直接 数值 模拟 (DNS) 方 法 进行 精确 求解 需要 极 高 的 时 间 、 空 
间 分 辩 率 , 而 早期 低下 的 计算 机 硬件 水 平 导致 该 方法 只 限于 低 雷 诺 数 的 简单 
流动 ,常常 作为 一 种 研究 手段 而 无 法 应 用 于 工程 领域 ,目前 ,为 降低 计算 量 ， 
保证 可 计算 性 , 世界 各 主流 厂商 普遍 利用 高 性 能 并 行 工 作 站 结合 近似 模拟 方 
法 如 基于 统计 理论 的 雷诺 平均 Navier-Stokes 方 程 (Reynolds averaged 
Navier-Stokes，RANS) 方 法 ， 基 于 流动 分 解 技 术 的 大 涡 模拟 (large 
eddysimulation, LES) 7713; ^ " EA f s AFAA (Detached Eddy Simulation) 
方法 "来 进行 外 流 场 计算 并 以 此 为 基础 进行 车 型 分 析 与 优化 。 这 些 方法 本 质 
上 是 降低 了 求解 精度 ， 其 结果 不 可 避免 的 对 汽车 产品 设计 与 分 析 造 成 影响 。 
随 着 人 们 对 汽车 低能 耗 比 需求 的 日 益 强 烈 ,汽车 外 型 设计 呈现 精细 化 的 趋势 。 
上 述 近 似 模拟 方法 已 经 逐渐 满足 不 了 高 精度 车 型 设计 的 需求 

2. 高 效能 求解 器 

包括 汽车 外 流 场 问题 在 内 , 计算 流体 力学 技术 的 核心 是 求解 流体 控制 方 
程 经 有 限 元 等 方法 离散 后 所 形成 的 稀疏 方程 组 。 计 算 精 度 要 求 提 高 、 车 型 复 
杂 化 以 及 大 雷诺 数 对 流 占 优 特 点 的 凸显 , 使 得 该 稀疏 方程 组 的 规模 十 分 巨大 
旦 伴随 着 强烈 的 非 线 性 ,求解 异常 困难 。 近 年 来 ， 大 型 并 行 计算 机 的 出 现 为 
计算 能 力 提 供 了 有 力 的 保障 , 而 研究 适用 于 求解 大 规模 非 线 性 稀 玻 方程 组 的 
高 可 扩展 并 行 算法 与 计算 机 硬件 资源 匹配 已 经 成 为 计算 机 辅助 工程 领域 非 


常 重要 的 研究 方向 ”。 

为 获取 高 精度 的 汽车 外 流 场 信息 , 本 文采 用 直接 数值 模拟 方法 对 流体 流 
动 进行 模拟 。 由 于 直接 数值 模拟 方法 的 计算 规模 与 雷诺 数 的 三 次 方 成 正比 ， 
庞大 的 计算 量 对 计算 机 的 硬件 与 算法 都 有 极 高 的 要 求 。 基 于 国家 超 算 深圳 中 
心 的 曙光 星云 超级 计算 平台 , 本 文通 过 对 大 规模 非 线 性 系统 进行 高 效 求解 器 

和 预 处 理 技术 的 研究 ， 提 出 一 种 可 扩展 并 行 Newton-Krylov-Schwarz 算 法 。 

非 线 性 方程 采用 非 精确 Newton 方 法 进行 求解 ， 在 每 个 Newton 步 ，Jacobian 
系统 通过 经 过 基于 区 域 分 解 方法 的 限制 加 性 Schwarz 预 条 件 子 处 理 后 使 用 
以 GMRES 方 法 为 代表 的 Krylov 子 空间 迭代 法 作为 线性 求解 器 进行 求解 。 为 验 
证 算法 , 本 文 首先 对 障碍 物 绕 流 标准 问题 进行 研究 ， 所 获得 的 流 场 数 值 结果 
风 洞 试验 数据 及 商业 软件 计算 结果 进行 对 比 。 随 后 ， 作 为 应 用 ， 我 们 对 某 
真实 汽车 的 外 流 场 问题 进行 计算 。 数 值 结果 显示 ,本文 提出 的 算法 计算 所 得 
> 流 场 数 值 结 果 相 较 于 商业 软件 所 得 计算 结果 更 为 精确 , 而 算法 的 并 行 测试 结 
T RER, 本 文 的 算法 在 扩展 至 数 干 处 理 器 平台 时 仍 具 有 非常 良好 的 可 扩展 并 
行 性 能 。 
本 文 的 结构 如 下 : 第 一 节 简 要 介绍 汽车 外 流 场 的 数值 模拟 技术 的 现状 
与 趋势 ， 第 二 节 对 流体 控制 方程 及 本 文采 取 的 有 限 元 离散 格式 进行 介绍 ; 
NKS 算法 描述 以 及 相关 数值 实验 分 列 于 第 三 、 四 节 ; 最 后 在 第 五 节 做 出 全 
文 的 总 结 与 展望 。 


2 汽车 外 流 场 流体 控制 方程 及 其 有 限 元 离散 


24 流体 控制 方程 

数值 模拟 技术 通过 计算 流体 控制 方程 以 获取 流体 运动 区 域 的 离散 解 ， 
汽车 周围 流体 流动 速度 一 般 低 于 0. 3Ma， 可 视 为 不 压缩 Newton ji, KEX 
用 三 维 非 定 常 不 可 压 Navier-Stokes 方程 描述 汽车 外 流 场 流动 : 


e 

e 

O p «X1 
1€» | - 


Cae u EF] (D 


dr 


其 中 请 、P 及 4 分 别 为 空气 密度 、 压 力 和 动力 粘度 系数 ， UTI 


速度 向 量 ， cz 下 2 为 柯 西 压力 张 量 ， 其 中 ， 工 为 特征 张 量 ， 


DAD 。 该 连续 方程 及 动量 守恒 方程 由 初始 条 件 ， 


mJ è CA 
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以 及 边界 条 件 : 
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约束 ， 其 中 Tw 为 速度 进口 边 ，1wa 为 车 体 表面 及 计算 区 域 边界 , 设 为 无 滑 


KEMUR, To 为 采用 远 场 边界 条 件 即 自由 出 流 边界 ， 8 为 进口 边界 条 
件 给 定 的 速度 。 
2.2 控制 方程 离散 

为 了 获取 流体 流动 数值 解 ， 数 值 模拟 技术 是 通过 将 控制 偏 微分 方程 按 
照 某 种 离散 格式 离散 ， 然 后 转化 为 各 个 计算 节点 上 的 代数 方程 组 ， 最 后 求 
解 得 到 各 节点 上 的 值 来 获取 整体 流 场 的 近似 解 ， 因 此 离散 化 与 代数 化 是 数 
值 计 算 的 前 提 。 对 于 本 文 的 瞬 态 问题 ， 偏 微分 方程 的 离散 在 空间 和 时 间 上 
HR, 选取 合适 的 时 空 离散 格式 对 后 续 求解 算法 有 重要 影响 。 

空间 离散 格式 方面 ， 考 虑 到 高 阶 的 有 限 元 在 离散 化 后 所 形成 的 矩阵 非 
零 元 素 过 多 从 而 影响 算法 整体 的 并 行 可 扩展 性 ， 结 合并 行 计算 的 特点 ， 我 
们 采用 低 阶 的 *-* 有 限 元 格式 对 空间 进行 离散 。 

通过 对 计算 区 域 Q 进行 剖 分 得 到 非 结构 四 面体 网 格 7"={K}， 定 义 测 
试 函数 及 权 函 数 空间 ， 


U = (u(.t)|u(.t) e[(Q, ust) g on Tau), 


= {u(-,t) | u(t) € [H'(Q)P, u(-,t) =0 on T inlet U Poat}, 


P = (p(,t) | pCt) e (0), 


? 
Navier-Stokes FE (1) 的 弱 形 式 可 描述 为 寻求 UE Ue» e 7? 使 得 所 有 
p € ut, € Pili: 


p h Z -dN + u fo Vu: ved + p folu - V)u: Bad 


- fa pV - d0 + f, (V -upd = faf - edo 
ica MS 间 可 以 表示 为 : 
- [u^(., t) | u^ . = DE lu! hi " ). u^ (-, t) —g on Linet}, 


Ul = {u (t) | u(,t) = 35 Dult), W(t) 20 on Tine U Luat}, 
P^ — (p*(,t) | p*(,t) = Da: 


PN, Nostris Joni po, WER, pi ERJ subi 
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压力 值 。 由 于 元 不 满足 LBB 和 条件， 因此， 通过 添加 适当 的 稳定 项 ”， 
空间 离散 有 限 元 系统 可 表示 为 : 
p fo 99 - &^dO + u fi, Vu! : V&^dO + p hw - V)u^ - 9^dQ 


-= fa pv -Pd + f (V -mpd + Y peri (V w^, TeV BN) 
Y ker. c + (u^ . V)u^ + Vp”, 7, (u^ - V^ + ve^) . 
一 f- dQ 十 Y ker^ (f, r,, (u^ - V^ + Ve), ' ， 

时 间 项 方面 ， 本 文采 用 了 全 隐 时 间 格 式 离散 进行 离散 。 全 隐 格 式 由 于 
减轻 甚至 消除 了 CFL 条 件 对 时 间 步 长 的 限制 , 在 进行 大 规模 数值 计算 时 县 
有 一 定 优势 。 有 具体 地 ， 针 对 上 述 不 可 压 Navier-Stokes 方程 ， 选 取 隐 式 向 
后 Euler 有 限 差 分 格式 对 时 间 项 离散 ， 即 将 控制 方程 (1) 离散 为 如 下 非 
线性 代数 方程 : 


phoyn-l m 
~ar = Sla”) (2) 


其 中 人 A! 为 时 间 步 长 ，5(w") 为 在 第 "时 间 步 经 空间 离散 后 形成 的 半 离 散 系统 。 
至 此 ， 问 题 化 解 为 在 每 个 时 间 步 求解 非 线性 方程 组 : 
Pen) =0 (3) 


3 Newton-Krylov-Schwarz 算法 


在 每 个 时 间 步 内 ， 经 有 限 元 离散 后 形成 的 系统 (3) 规模 十 分 巨大 且 
由 于 对 流 占 优 而 具有 很 强 的 非 线 性 。 求 解 此 类 大 规模 的 病态 问题 时 ， 一般 
均 需 借助 大 型 并 行 计算 机 及 相应 的 可 扩展 性 算法 进行 求解 。 实 际 上 ， 多 数 
基于 偏 微分 方程 的 工程 应 用 与 科学 计算 问题 如 污染 扩散 模拟 、 数 值 天 气 预 
报 等 最 终 都 会 形成 稀 朴 的 线性 或 非 线 性 方程 组 ， 由 于 在 现实 生活 中 这 些 问 
题 多 以 非 线性 的 方式 存在 且 往 往 规 模 巨 大 ， 因 此 大 规模 稀 朴 非 线性 方程 组 
的 求解 方法 成 为 数值 计算 领域 的 研究 热点 。 非 线性 方程 组 的 求解 通常 包含 
线性 化 、 线 性 求解 器 构造 以 及 预 处 理 等 多 个 步骤 ， 本 文 据 此 进行 相关 非 线 
性 方程 组 求解 算法 的 研究 。 

目前 非 线性 方程 组 线性 化 方法 中 最 常用 且 有 效 的 是 Newton 型 方法 。 
其 中 ， 非 精确 Newton 方法 虽然 需要 求解 原始 的 Jacobian 矩阵 ， 但 是 却 不 
需要 精确 求解 ， 可 通过 求解 精度 来 达到 计算 量 与 收敛 速度 的 平衡 。 在 线性 
求解 器 方面 ， 由 于 直接 法 求解 大 规模 线性 方程 组 对 计算 机 内 存 及 速度 要 求 
过 高 而 不 现实 ,因此 目前 使 用 迭代 法 求解 大 规模 非 线性 系统 几乎 成 为 唯一 
选择 。 本 文 基于 Krylov 子 空间 的 迭代 方法 构造 线性 求解 器 。 上 述 两 种 方 
法 结合 为 Newton-Krylov 迭代 法 , 该 方法 的 核心 是 在 每 个 非 线 性 迭代 步 通 
过 采用 Krylov 子 空间 迭代 法 求解 一 个 雅 可 比 线性 方程 组 从 而 获得 Newton 
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增 量 。 


无 论 在 线性 、 非 线性 迭代 法 中 ， 预 条 件 子 都 起 到 加 速 收 敛 的 作用 ， 在 
数值 算法 构造 中 占据 重要 地 位 。 其 作用 是 以 较 低 的 额外 代价 换取 过 代 次 数 


的 大 幅 降 低 和 求解 时 间 的 有 效 减 少 ， 预 条 作 


F 子 的 构造 往往 依赖 于 所 研究 的 


物理 问题 ”， 对 预 条 件 子 的 改进 是 提高 整个 数值 算法 性 能 的 关键 。Dryja 
FI Widlund 的 研究 表明 ， 区 域 分 解 方法 既 可 以 作为 迭代 法 也 更 适合 于 作 


为 其 他 高 效 迁 代 求 解 器 的 预 条 们 


F 子 。 同 时 区 域 分 解 预 条 件 子 由 于 其 “分 而 


治之 ”的 特点 ， 尤 其 适合 于 当前 流行 的 分 布 式 并 行 计算 机 环境 。 
本 文 提 出 了 使 用 与 求解 汽车 外 流 场 问题 的 
Newton-Krylov-Schwarz (NKS) 算法 。 使 用 非 精 确 Newton 算法 作为 非 线 


基 于 


ERD, 


性 求解 器 , 在 每 个 非 精 确 Newton 步 里 使 用 由 


基于 区 域 分 解 方法 的 Schwarz 


预 处 理 算 子 来 加 速 Krylov 算法 求解 Jacobian 方程 。 其 详细 步骤 列举 如 下 : 


NKS 算法 : 


步骤 1: 使 用 前 一 个 时 间 步 的 解 作 为 初始 值 X? = X", 


步骤 2: 对 A 一 0, Lo … "执行 以 下 步骤 ， 直 至 收敛 


步骤 2. 1: 构造 Jacobian 4E EJ, 
步骤 2.2: 采用 带 有 预 处 理 的 Krylov 子 空间 方法 (如 GMRES) 非 


步骤 2. 3: 


通过 线 怕 


精确 求解 如 下 Jacobian 系统 Ji(Mi) !M;S; zi -FH XE 


n 
搜索 获得 步 长 从 ， 


步骤 2.4: BIRRA kH 7 Xk TES, 


Epp, TERIEN 


LE 方 程 组 F"(X) 在 点 Xk 处 的 全 Jacobian 矩阵 ， 


为 一 水 平 加 性 Schwarz 预 条 件 算 子 ， 其 具体 形式 参见 相关 文献 ”"， 步 
Uk 2. 2 中 非 精确 是 指 求解 Jacobian 系统 时 满足 如 下 条 件 即 可 : 


式 中 以为 线 怕 


线性 系统 (3)。 


本 章 介 绍 的 算法 基于 阿 贡 


求解 器 的 相对 收敛 误差 。 
在 本 研究 中 ， 我 们 使 用 该 算法 求解 2. 2 节 中 控制 方程 离散 后 形成 的 非 


| IMG MESE + F"(Xj) |< ag IE") | 


国家 实验 室 开发 的 开源 可 移植 并 行 软件 包 


PETSc ( Parallel Extensible Toolkits for Scientific Computing) n 


实现 。PETSc 基于 其 而 


线性 代数 子 程序 库 (BLAS)， 线 性 代数 包 LAPACK 以 


及 消息 传递 接口 库 MPI 等 构成 线性 求解 器 、 非 线性 求解 器 以 及 时 
个 主要 的 组 件 ， 为 用 户 提供 了 包括 求解 大 规模 稀疏 线性 


分 器 三 


种 Krylov 子 空 


间 方 法 在 内 的 丰富 的 全 


台 上 上 有 其 有 强大 的 偏 微 分 方程 数值 求解 


间 步 进 积 
:方程 组 的 多 


法 以 及 预 条 件 子 ， 在 高 性 能 计算 平 
E 力 。 目 前 PETSc 已 经 成 功 应 用 于 优 


化 问题 


4 数值 算 例 


、 生 物 医学 、 计 算 流体 动力 学 等 多 类 工程 与 科学 计算 问题 。 
本 文 的 数值 实验 皆 在 国家 超 算 深圳 中 心 的 曙光 星 


云 超级 计算 机 上 展 


开 ， 该 计算 平台 的 科学 计算 分 区 拥有 640 个 计算 节点 ， 每 个 节点 配置 双 路 


六 核心 Intel565002. 76GHz 处 理 器 与 24GB 内 存 ， 共 计 7680 个 CPU 处 理 核 
心 ， 网 络 互 联 方式 为 InfiniBand4 万 兆 网 络 ， 操 作 系 统 为 Linux。 


在 本 节 , 我 们 首先 研究 了 较 低 雷诺 数 下 外 流 场 流动 标准 测试 问题 来 验证 


算法 的 正确 性 


与 并 行 性 能 。 


进行 计算 。 本 节 采用 


通过 流 场 信 息 
价 。 随 后 ， 我 们 从 工程 实际 问题 出 发 对 真实 尺寸 、 


实验 结果 具有 可 比 性 且 有 对 比价 值 ， 
均 采 用 同样 的 几何 模型 、 
及 边界 条 件 。 
41 障碍 物 绕 流标 准 问题 


为 了 支持 及 开展 基于 高 性 能 计算 机 的 流体 数值 模拟 研究 工作 ， pa he: 
(Priority Research Program) 资助 了 多 种 典 


基金 通过 优先 支持 项 目 


NKS 算 
流体 材料 属性 、 


与 并 行 性 外 


流动 的 数值 模拟 研究 工作 。 


中 之 一 。 车 辆 的 外 部 流 场 属于 典型 的 绕 
计算 ， 所 获取 的 结果 与 风 洞 试验 以 及 CFX 的 


类 绕 流 标准 问题 进行 
果 进 行 对 比 来 验证 算法 的 正确 性 。 
4.1.1 障碍 物 标 准 绕 流 问题 模型 


通过 开展 大 量 的 风 洞 试验 获取 相关 流 # 
为 验证 数值 模拟 算法 提供 了 丰富 有 效 的 对 比 数据 ， 障碍 物 绕 


两 方面 对 入 
高 雷诺 数 的 汽车 外 流 场 
KS 算法 所 获取 的 结果 与 风 洞 试验 以 及 目前 
用 计算 流体 力学 软件 CFX 的 计算 结果 进行 对 比 来 验证 算法 的 正确 性 。 


前 主流 


法 与 商业 软件 ; 
计算 区 域 、 有 限 元 网 格 以 及 初始 


流 问 题 ， 本 节 


本 小 节 的 数值 算 例 为 圆柱 体 与 长 方 体外 部 绕 流 ”， 


如 图 1 所 示 ， 


d eR 
5e Viri |j] je (88 a Hc 


采用 NKS 算法 对 其 


法 进行 评 


的 商 
为 使 


行 数值 计算 时 


E 
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图 1 障碍 物 标准 绕 流 问题 模型 及 计算 区 域 扩 寸 上: 圆柱 体 ， 下 : 长 方 体 ) 


进口 为 给 定 的 垂直 于 入 口 面 速度 所 ， 出 口 为 自由 流 边 界 ， 其 余 边界 为 
无 滑 移 壁面 边界 。 物 性 参数 为 : 动力 粘度 系数 1 = 1.0 x 10-3kg/ms， 密 度 
p-— lO0kg/m?; 特征 长 度 取 边 长 或 直径 D = 0.1m。 计 算 区 域 剖 分 后 四 面体 网 
格 数 约 为 51 x 105， 上 自由 度 DOF = 3.6 x 105。 

本 例 中 Newton-Krylov-Schwarz 算法 各 参数 设置 如 下 : 线性 与 非 线 性 


相对 误差 分 别 设置 为 1.0 x 10-4 和 1.0 x 1075; 


CFX 中 ， 采 用 二 阶 向 后 Euler 


格式 对 时 间 项 进行 离散 。 残 差 收敛 条 件 设 置 为 均 方 根 (Root Mean Square; 


RMS) 误差 设 为 1.0 x 10-5， 在 16 核 处 至 


442 流 场 数值 结 
在 外 流 场 分 析 


量 气动 性 能 的 最 重要 的 参数 。 


此 外 ， 


器 条 件 下 进行 计算 。 


， 气 动力 及 其 系数 如 阻力 系数 Ce 、 升 力 系 数 C' 等 是 衡 


PRU AR XO HE 


所 得 的 气动 参数 进行 比较 。 
我 们 还 在 障碍 物 迎 风 面 及 背风 面 设 置 两 个 观测 点 
a(x«, Ya, za) = (0.45,0.20, 0.205) 和 b(z6, yo, 26) = (0.55,0.20,0.205), 使/ 


j 两 点 间 的 


HE 7328 AP = APt = P(za, Ya, za 0) 一 P(xa,ya,zast) 来 观测 与 对 比 流 场 的 数值 


结果 。 对 于 两 个 障碍 物 算 例 ， 本 文 对 比 了 其 稳 态 与 瞬 态 两 种 情况 ， 列 于 表 


S4 Cylinder 


lo 
SE 表 1 “障碍 物 绕 流 测试 算 例 
~ Case Obstacle Type Inflow condition 
, Si Square U(0, y, z) = 16U 4 yz(H — y)(H — z)/ H* 
S4 Cylinder tady V =W 20, Um = 0.45m/s 
S3 Square U(0, y, z, t) = 16Umyz(H — y)(H — z)sin(nt/8)/H* 
Transient 


V =W =0, Um = 2.25m/s 


在 瞬 态 算 例 中 , 总 时 间 T = 8s, 时 间 步 长 取 At = 0.085, 


气动 系数 Cs 和 


取 最 大 值 Cas 与 Cimas，a 与 ?点 压力 值 P 取 时 刻 t — 8s 的 值 。 
X2 ”针对 障碍 物 扰 流 问 题 NKS 算法 、CFX 以 及 风 洞 试验 结果 对 比 


Case Results Ca Ct AP 
NKS 17.661 0.077 0.175 
Sı CFX 7.721 0.0748 0.174 
Experiment 7.500 ~ 7.700 0.060 ~ 0.080 0.172 ~ 0.180 
NKS 6.139 0.010 0.171 
S2 CFX 6.225 0.013 0.165 
Experiment 6.050 ~ 6.250 0.008 ~ 0.010 0.165 ~ 175 
NKS 4.382 0.034 一 0.145 
S3 CFX 4.378 0.010 一 0.140 
Experiment 4.300 ~ 4.500 0.010 ~ 0.050 — —0.140 ~ —0.120 
NKS 3.267 0.002 —0.113 
S4 CFX 3.298 0.004 —0.109 
Experiment 3.200 ~ 3.300 0.002 ~ 0.004 —0.090 ~ —0.110 


本 文 提出 的 算法 与 


4433 并行 可 扩展 性 结果 


NKS、CFX 以 及 风 洞 试验 结果 对 比 列 于 表 2。 从 对 比 结果 我 们 可 以 看 出 ， 
淆 业 软件 计算 结果 接近 ， 同 样 都 在 风 洞 试验 所 得 数据 误 
差 范围 之 内 ， 证 明了 数值 方案 以 及 算法 的 正确 性 。 


本 小 节 给 出 基于 NKS ARES 
展 性 结果 。 两 套 不 同 规模 的 网 格 ， 分 别 约 含 5.1 x 106 个 四 面体 单元 CDOF 
3.6 x 1090 和 1.3 x 107 个 四 面体 单元 (DOF = 9.1 x 109 ) ， 被 用 于 可 扩展 
性 的 测试 。 在 本 例 中 固定 时 间 步 长 At = 4.0 x 10-3s， 在 计算 过 程 中 ，NKS 
E 相 对 误差 分 别 设置 为 1.0 x 1079 和 1.0 x 1072. X 
减 小 计算 量 ， 取 前 20 时 间 步 的 数值 结果 的 平均 值 。 


算法 中 线性 与 非 线 性 


圆柱 形 障碍 物 标准 


流 问 题 的 并 行 可 扩 
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表 3 NKS 算法 障 求解 碍 物 绕 流 问 题 的 并 行 性 能 


np DOF=3.6 x 108 DOF=9.1 x 108 
Newton | GMRES Time Newton | GMRES Time 
64 2.9 57.67 182.54 = = s 
128 2.9 58.48 94.57 = s 
256 2.9 59.47 53.28 3.1 65.63 137.08 
512 2.9 62.17 34.73 3.1 68.43 76.51 
1024 2.9 65.00 27.67 3.0 74.10 49.86 
2048 = 2.9 79.97 38.49 


表 3 列 出 了 不 同 处 理 器 条 件 下 计算 的 可 扩展 并 行 数 值 结果 。 其 中 Newton, 
GMRES 和 Time 分 别 表 示 为 每 个 时 间 步 内 非 线 性 迭代 次 数 、 线 性 迭 代 次 数 
以 及 计算 时 间 (单位 为 秒 )。 

为 了 更 加 清晰 地 展示 可 扩展 性 性 能 ， 本 文 将 并 行 数值 结果 以 加 速 比 
的 形式 列 图 2 中 。 加 速 比 通常 用 来 衡量 并 行 系统 或 程序 并 行 化 的 性 能 和 效 
果 。 在 本 论文 中 加 速 比 是 指 固定 计算 规模 , 以 最 低 核 数 所 需 计 算 时 间 基 准 ， 
增加 并 行 处 理 器 个 数 后 计算 时 间 与 基准 时 间 之 比 的 倒数 。 理想 加 速 比 是 
指 线性 的 加 速 情 况 。 


16 一 一 一 
K 


"" 6 
—9- DOF-3.6 x 10 —9- DOF-3.6 x 105 


—B- DOF-9.1 X 10* | | 78-DOF-9. x 10* 


Compute time 


1 2048 64 1 512 1024 2048 


128 256 52 — 28 256 
Number of processors Number of processors 


图 2 汽车 外 流 场 模拟 中 每 时 间 步 的 平均 计算 时 间 及 加 速 比 


并 行 数值 结果 显示 非 精 确 Newton 方法 使 非 线性 迭代 次 数 Newton 非常 
少 ， 非 线性 迭代 次 数 几乎 与 处 理 器 个 数 无 关 。 线 性 迭 代 次 数 GMRES 随 核 数 
的 增加 而 略微 增加 。 计 算 时 间 与 加 速 比 等 数值 结果 显示 针对 低 雷 诺 数 问 
题 ， 在 DOF = 3.6x105 的 算 例 中 ， 当 核 数 小 于 1024 时 ， 计 算 效 率 在 65 以 
上 ， 当 核 数 达到 1024 时 ， 计 算 效 率 会 有 所 下 降 ， 这 并 不 是 算法 使 然而 是 由 
计算 规模 不 足 造成 的 。 当 进行 分 区 计算 时 ， 如 果子 区 域 的 规模 较 小 ， 那 么 
在 整体 求解 时 间 中 子 区 域 间 通 信 时 间 所 占 的 比例 将 会 提高 ， 导致 计算 效 
率 的 降低 。 整 体 而 言 ， 本 文 提 出 的 并 行 NKS 算法 具有 非常 好 的 可 扩展 性 ， 
当 处 理 器 个 数 达 到 2048 时 并 行 效率 仍 在 50% 左 右 。 

4.2 汽车 外 流 场 问 题 
4.2.1 汽车 几何 模型 与 计算 区 域 

在 分 析 车 型 空气 动力 学 性 能 前 ,首先 需要 使 用 数字 化 建 模 技术 对 原始 

设计 车 型 进行 几何 建 模 。 本 文采 用 三 维 CAD 软件 依据 某 真 实 车 型 全 尺寸 数 
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据 进行 模型 构造 。 如 图 3 所 示 , 整 车 长 En, 车 宽 VV Sym, 
车 高 E4033wr， 轴 路 BASA, 


在 研究 外 流 场 问题 时 ， 车 体 表面 附近 区 域 及 尾 流 


区 域 的 流体 分 布 情况 


是 我 们 主要 的 研究 对 象 ， 但 由 于 流体 的 连续 介质 特性 以 及 边界 条 件 的 影 
响 ， 往 往 需要 将 车 体 置 入 茶 个 封闭 的 计算 区 域 6. ， 然 后 针对 整个 2 进行 分 
析 求 解 。2 的 选取 与 计算 问题 有 关 ，2 必须 足够 大 以 尽量 避免 区 域 壁面 对 


车 体外 流 场 的 影响 ， 同 时 还 要 兼顾 整体 计算 量 的 大 小 。 此 外 ， 在 训 分 网 格 
时 ， AEE ERREAREN EAE RURIEHS BU DURI ERE 


面 特征 ， 即 所 谓 的 包 面 技术 。 


能 够 实现 复杂 模型 外 流 场 计算 的 关键 所 在 。 


包 面 技术 在 进行 外 流 场 计 算 时 十 分 重要 ， 是 


要 加 密 至 极 小 。 文献” 指出 计算 区 域 边界 应 


应 用 上 取 3 倍 车 高 对 精度 影响 不 大 却 


距 模 型 5 一 10 倍 车 高 


图 3 汽车 三 


非 结 构 四 面体 网 格 7={5) 的 剖 分 是 进行 有 限 元 计算 的 前 提 ， 


因此 ， 网 格 在 车 体 表面 往往 需 


E 模 型 7 一 10 倍 车 高 ， 在 工程 


E 极 大 减少 计算 量 , 尾 流出 口 边 界 应 


高 ， 因 此 本 文 计 算 区 域 选 为 


面 Z=0 为 车 体 对 称 面 ， 坐 标 原点 位 于 车 体 前 ? 


P- 


维 CAD 模型 及 计算 


ni E FIRE RS DERE 


区 域 示意 图 


在 本 算 


如 图 3 所 示 ， 平 


例 中 ， 通 过 商用 软件 ICEMCFD 对 计算 区 域 Q 进行 非 结 构 网 格 剖 分 ， 在 划 
分 网 格 时 ， 我 们 对 车 体 壁面 等 对 流体 运动 影响 较 大 以 及 尾 流 区 等 对 汽车 气 
动 分 析 关 系 密切 区 域 进行 加 密 处 理 。 经 训 分 后 ， 本 算 例 的 非 四 面体 网 格 总 


数 约 为 1.2 x 10"， 自 由 度 约 为 DOF = 1.03 x 107， 
计算 区 域 即 离散 后 的 网 格 进行 分 区 以 使 月 


坚 米 量 级 。 算 法 的 实现 需要 对 
域 分 解 方法 构造 适当 的 预 条 件 


车 身 附近 网 格 尺 寸 达到 


H 


X. 


子 。 通 过 调用 开源 软件 包 ParMETIS 进行 网 


格 分 区 ， 一 般 分 区 的 个 数 与 处 理 器 个 数 相 等 
个 数 近似 相同 以 达到 负载 平衡 ， 如 图 4 所 示 。 


， 且 各 个 分 区 所 计算 的 自由 度 
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图 4 汽车 外 流 场 网 格 剖 分 与 区 域 分 解 示意 图 


选取 25C 标 准 大 气压 下 空气 参数 ， 密 度 仿 卫 89/77， 动 力 粘度 系数 
23xetrz。 设 进口 速度 9 ， 时 间 步 长 At=0.01s， 计 算 1s 内 流 场 
的 变化 情况 。 算 法 中 的 线性 和 非 线性 求解 器 的 相对 收敛 误差 分 别 取 为 10” 


-6 = ` x. peun ` P * 55 
$107, 分 别 取 乞 =30m/s 为 特征 速度 ， 车 高 -1.41m 为 特征 长 度 ， 计 算 雷 
诺 数 
_purH _1.185kg / m° x30m/ sx1.41m 

u 1.831x10?Kg /ms 


为 验证 数值 计算 结果 的 正确 性 ， 我 们 采用 汽车 工业 中 普遍 采用 的 商业 
CFD 软件 ANSYS. CFX 对 添加 标准 -se 湛 流 模 型 ， 相 同 网 格 数 、 边 界 条 件 的 
问题 进行 数值 模拟 ,获得 的 数值 结果 用 于 与 本 文 算法 获取 的 数值 结果 进行 
对 比 。 在 CFX 中 ， 瞬 态 项 采用 二 阶 问 后 Euler 格式 ， 均 方 根 残 差 (RMS) 
收敛 误差 为 10”。 

422 流 场 数值 结果 

以 阻力 系数 Cu 为 代表 的 空气 动力 学 系数 是 影响 车 型 设计 的 最 主要 参 
数 ， 设 计 人 员 往 往 据 此 来 评判 车 型 的 能 耗 比 以 及 气动 安全 性 能 。 本 文中 首 
先 对 0 一 1s 时 间 内 NKS 算法 与 CFX 计算 得 到 阻力 系数 Cu 进行 比较 ， 瞬 态 数 
值 结果 列 于 图 5。 阻 力 系 数 对 比 图 显示 ， 两 种 算法 计算 得 到 的 阻力 系数 基 
本 一 致 。 


Re =2.738x10° 


一 NKS algorithm 


*- ANSYS CFX 


0 0.1 02 0.3 0.4 0.5 06 07 0.8 0.9 1 
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图 5 汽车 阻力 系数 数值 结果 对 比 
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随后 ， 我 们 取 #=1s 时 刻 两 种 算法 的 流 场 结果 进行 比较 。 首 先 我 们 比 
较 了 和 车身 表面 静 压 《单位 为 由 )， 如 图 6 所 示 。 


ETTER 
m ë 
ETETETT 


图 6 汽车 车 体 前 身 压 力 分 布 对 比 云图 E: CFX， 右 : NKS) 


静 压 的 大 小 与 分 布 与 汽车 所 受 的 气动 力 直接 相关 ，NKS 与 CFX 的 计算 
结果 均 显 示 车 身 表面 静 压 呈 对 称 分 布 。 静 压 高 值 分 布 于 车 体 前 身 、 前 挡 风 
玻璃 、 后 视 镜 以 及 车 轮 的 迎风 面 。 车 前 身 其 余部 分 压力 稍 高 于 大 气压 ， 车 


图 7 车 体 对 称 面 〈Z=0) 二 维 流 线 图 CE: CFX， 下 : NKS) 
在 图 7 所 示 车 体 截面 流 线 分 布 中 ， 我 们 也 注意 到 NKS 算法 所 获取 的 流 
场 结 果 在 车 挡 风 玻璃 、 车 尾 及 近 地 面 附件 能 够 捕捉 到 更 细小 的 涡 ， 显 示 出 
更 详细 的 流 场 信息 。 


423 并 行 可 扩展 性 结果 
本 小 节 给 出 基于 NKS 算法 求解 汽车 外 流 场 的 并 行 可 扩展 性 数值 结果 ， 
实验 所 取 网 格 自由 度 约 为 103x10 , Newton 非 线 性 迭代 与 Krylov 子 空间 


方法 线性 迭代 收敛 误差 分 别 设置 为 1 和 1I0 ， 数 值 结 果 取 前 20 个 时 间 步 
的 平均 值 。 


表 4 汽车 外 流 场 模拟 中 NKS 算法 的 并 行 性 能 


Tlp Newton GMRES Time 
256 2.9 90.4 226.0 
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512 2.9 106.2 141.1 
1024 2.9 114.0 85.6 
2048 2.9 119.6 60.5 


表 4 列 出 了 不 同 处 理 器 条 件 下 计算 的 可 扩展 并 行 数值 结果 。 Newton, 
GMRES 和 Time 分 别 表示 为 每 个 时 间 步 内 非 线 性 迭代 次 数 、 线 性 迭代 次 数 
以 及 计算 时 间 (单位 为 秒 )。 为 了 更 加 清晰 地 展示 可 扩展 性 性 能 ， 本 文 将 


并 行 数值 结果 以 加 速 比 的 形式 列 于 图 8 中 。 


8 


-e- - 7 
|-e-bor 1.03 X 107 DOF-1.03 X 10 


=-=- Ideal 


4 

o 141.1} 
5 S 
E i 
E 
É & 
© pls 
à 2 

85.6 

60.5 


1024 2048 3$; 


512 2. 
Number of processors 


512 
Number of processors 


1024 2048 


图 8 每 时 间 步 平均 计算 时 间 与 加 速 比 


从 并 行 测试 结果 我 们 可 以 看 到 ， 由 于 采用 了 前 


始 值 ， 每 个 时 间 步 的 非 线性 和 迭代 次 数 Newton 非常 少 ， 


时 间 步 的 结果 作为 初 
非 线性 迭代 次 数 几 


乎 与 处 理 器 个 数 无 关 。 随 着 计算 核 数 的 增加 ， 线 性 迭代 次 数 GMRES 略微 增 
加 。 计 算 时 间 等 并 行 数值 结果 显示 我 们 的 算法 具有 非常 好 的 可 扩展 性 ， 处 


理 器 个 数 达 到 2048 时 并 行 效率 仍 在 50% 左 右 


5 结论 


复杂 几何 造型 、 高 雷诺 数 时 致 汽车 外 流 场 的 精确 
巨大 、 非 线性 强 而 极 难 展 开 ， 是 目前 工程 计算 领域 中 非常 具有 挑战 性 的 问 
题 。 寻 求 稳 定 、 可 扩展 的 高 效 并 行 数 值 算 法 以 获取 时 效 性 强 且 可 置信 的 数 
值 结 果 是 工程 实际 应 用 的 关键 所 在 。 本 文 提出 一 种 并 行 的 


数值 求解 因 计 算 规 模 


Newton-Krylov-Schwarz 算法 来 求解 控制 方程 有 限 元 离散 后 形成 的 大 规模 


黎 玻 非 线性 方程 组 。 基 于 该 算法 ， 本 文 首 先 对 较 低 雷诺 的 标准 绕 流 问题 ; 


行 求解 ， 流 场 结果 与 风 洞 试验 数据 以 及 商业 CFD A 


计算 结果 进行 对 比 ， 


验证 了 算法 的 准确 性 。 随 后 作为 应 用 ， 本 文 对 真实 尺寸 的 汽车 外 流 场 流体 
流动 进行 数值 模拟 。 流 场 数 值 结果 以 及 并 行 数值 结果 表明 本 文 提 出 的 算法 
在 数 干 核 处 理 器 条 件 下 仍 具 有 良好 的 并 行 可 扩展 性 能 。 
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广东 省 科技 计划 国际 合作 项 目 (2011B050400037) 
在 外 流 场 分 析 中 ， 气 动力 及 其 系数 如 阻力 系数 Cy、 升力 系数 Ci 等 是 衡量 
气动 性 能 的 最 重要 的 参数 ， 气 动力 的 计算 公式 如 下 : 


阻力 Py: 
Ut 
F= Lt n, — pn, | dS 
d i (; Ən ny — pn K 


Qu, 
h = -f (rins — 2) dS 


其 中 9 为 障碍 物 表面 积 ，nz . nyoa ASE rz 、 yy 方向 的 法 向 向 量 ，wi 
为 沿 着 5 的 切 向 向 量 t= (ny, 一 mnz;0) 方 向 的 切 向 速度 分 量 。 
与 阻力 及 升力 相对 应 的 阻力 系数 C4 与 升力 系数 Cl 定义 如 下 : 


2Fa 


FEJ Fy: 


Cu = =9 
pU DH 

2H 

Q= —- 
pU DH 


其 中 DU(t) = 4U(0, H/2, H/2.0)/9. 为 定义 的 特征 速度 ， 同 样 用 于 计算 雷诺 数 : 
pUD  1.0kg/m? -2.25m/s - 0.1m 
Re = 三 三 225 
m 1.0 x 10-?Kg/(m - s) 
可 见 Benchmark 问题 的 雷诺 数 较 低 。 
为 了 对 比 其 他 流 场 信息 ， 除 了 气动 系数 外 ， 我 们 还 在 障碍 物 迎 风 面 及 背风 
面 设置 
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